Nikkei Mac 20

home *** CD-ROM | disk | FTP | other *** search

/ Nikkei Mac 20 / NIKKEI-MAC-CD-VOL-20-1998-12.ISO.7z / NIKKEI-MAC-CD-VOL-20-1998-12.ISO / オンラインソフト / 5.文書作成支援 / ConvChar 0.8.2.sea / ConvChar 0.8.2 Folder / ConvChar0.8.2ﾇ…ﾇｬﾇ｢ﾇƒ < prev next >

Wrap

Text File | 1998-07-03 | 12KB | 348 lines

テキスト変換ユーティリティー ConvChar 0.8.2 ■ConvCharとは ConvChar は定型的なテキスト変換をドラッグ＆ドロップで簡単に行えるアプリケーション・プログラムです。 ■Ver. 0.8.2での変更点（98年６月）設定ダイアログに「辞書の扱い」ポップアップメニューを新設、変換辞書を複数ロードして文字列の一括置換を行う際に「順次処理する」を選択できるようにしました。従来は複数の辞書を一つの辞書として扱い、内容が矛盾する場合は１、２、３の順に優先して一括処理していました。新設した「順次処理する」選ぶと、１の辞書で置換した出力結果を２の辞書でさらに置換する、といったように複数の辞書による置換を個別に順次自動処理できます。なお、「マージする」を選べば従来通り処理します。 ■「順次処理する」のメリットたとえば、文中に混在している「サーバ」と「サーバー」という文字列を「サーバー」に統一したい、という場合を例に挙げます。単純に「サーバ」を「サーバー」に置換してしまうと、もともと「サーバー」だった部分は「サーバーー」になってしまいます。これを回避するには「サーバー」を文章中に絶対に出てこない文字列、たとえば「＃＃＃＃」に置換します。次に「サーバ」を「サーバー」に置換します。最後に「＃＃＃＃」を「サーバー」に置換すればうまくいきます。しかし、これを複数の単語に対して何度も行うとなると面倒な作業です。もちろん、正規表現を使った検索置換をマスターしていればそれほどでもないのですが、習得する気がない人も少なからずいらっしゃることでしょう。また毎回、定形的に繰り返して行うなら手間は一度で済ませたいものですね。今回の「順次処理する」を利用し、複数の辞書を作る手間さえ厭わなければ、このような条件分岐的な要素を含む検索置換が可能です。 ■使い道 ●用語の統一、言い替え。（７） ●通信ログの不要行削除、DOSテキストの改行変換。（６、７） ●改行つきテキストの行改行削除（７）→サンプル辞書参照。 ●翻訳ソフトの前処理。（７、8） ●英単語、日本語置換による簡易翻訳支援。（７、６）→サンプル辞書参照。 ●IM ( FEP ) や翻訳ソフトの辞書メンテナンスに。（１、２、４、５、７）表計算ソフト（列順入れ替え）と組み合わせて効率よく辞書テキストを加工、変換できます。 ●CD-ROM や複数のボリューム上に散在する "Read Me" ファイルなどを、好みのテキストエディタ書類として一カ所のフォルダに保存する。（８） ■サポートする変換は以下の７つで、組み合わせて一度に行えます 1: タブ→スペース整形タブで整形された文書を、スペースで整形し直します。 2: スペース→タブ整形１の逆です。「タブ間隔」を"1"に設定した場合は単純に半角スペースを同数のタブに置換。 ▲タブ←→スペースの一対一置換は「文字列の置換」でも可能です。（バージョン0.8ドキュメントでの本機能の説明は記述ミスです。お詫びします） 3: 英単語に分割英文テキストを単語ごとに別行にします。 4: 行のソート行改行されたテキストを文字コード順に並べ替えます。（オプションでナチュラルオーダーソート） 5: 重複行をまとめる連続する同一の行を一つにまとめます。ソート後なら全ての重複行をまとめます。 6: 空白行を除去３つ以上連続した改行 (CR) を２つにします。 7: 文字列の置換予め作成した辞書ファイルに従って文字列を一括置換します。辞書ファイルは通常の TEXT ファイルを使用しますので簡単に作れます。 8: Non 内容の変換をせず、元ファイルの内容を複製した TEXT ファイルを作製します。作成アプリケーションの違う文書や、あちこちのボリュームにある文書を一カ所に常用するテキストエディタの書類として保存できます。処理対象ファイルは、デフォルトのままではファイルタイプが "TEXT" のものと SimpleText の「編集不可書類」 ( ttro ) ですが、設定次第でファイルタイプに関わらず開けますから、ワープロソフト文書も処理できます。その場合、制御文字を除去します。出力ファイル名は元ファイル名の末尾に "+" をつけたものになります。 ■インストール ConvChar をハードディスクにコピーするだけです。また、用途別に複数の ConvChar をインストールすると、いちいち設定をやり直す手間が省けます。（設定は初期設定ファイルを作成せず、アプリケーション内部に保存されます） ▲「文字列の置換」は大量にメモリを消費します。複数の辞書や大きな辞書を使う場合は、あらかじめ ConvChar のメモリ使用サイズを大きめにしてください。 ■使い方 ConvChar を起動すると、ファイル選択ダイアログが現れます。いったんキャンセル（Escキー）して、ファイルメニューから「設定」を選んでください。 ▲初回の使用前に、「タブ間隔」と「出力ファイルのクリエータ」を必ず確認してください。迷った場合は、「初期設定に戻す」ボタンを押してください。 ▲変換辞書は「ロード」ボタンをクリックして選択します。（起動ボリュームを変更した場合は、辞書の再定義が必要です） ▲「辞書の扱い」で「マージする」を選択した場合は、複数の辞書を一つの辞書として扱い、内容が矛盾する場合は１、２、３の順に優先して一括処理します。 ▲「順次処理する」選ぶと、１の辞書で置換した出力結果を２の辞書でさらに置換する、といったように複数の辞書による置換を個別に順次自動処理します。 ▲「置換時に大文字、小文字を同一視」をチェックすると処理に時間がかかります。 ▲「ナチュラルオーダーソート」にチェックをいれると、ナチュラルオーダーでソートを行います。行頭に番号やアルファベット（半角）を打ってあるリストのソートに便利です。ただし通常のソートよりも時間がかかります。(このドキュメントの最後に「ナチュラルオーダーソート」の簡単な説明があります） ▲「タブ間隔」は「タブ→スペース整形」および「スペース→タブ整形」時に、タブ間隔を半角スペース何個相当と見なすかを指定します。初期設定は "4" です。 ▲「対象とするファイルタイプ」で「何でもいい」を選択すればワープロ書類も開けますが、テキスト文字列以外の情報は無視されます。また、書類によっては制御コードなどが大量のゴミとなって残ります。ワープロソフトによっては全く読めないこともあります。どうしても、自分の持っていないワープロソフトの書類の内容が知りたいときに使用してください。 ▲「出力ファイルのクリエータ」は直接 FileCreator を入力するか、「アプリ選択」ボタンをクリックしてテキスト編集アプリケーション、またはそのアプリで作成された書類を選んでください。初期設定は "JEDT" (Jedit) になっています。 ▲「テキストの出力先」を「ConvChar（本体のある）のフォルダ」、「（変換）元ファイルのフォルダ」、「（その都度）出力時に指定」の３つから選択します。「設定」ボタンを押しダイアログを閉じて、ファイルを選んで処理内容を選択します。 ▲処理内容は同時に５つまで選べます。同じ処理を二度指定できますが、文字列の置換は一度しか選択できません。 ▲処理内容が違っても同じ名前のファイルを再度処理すると、出力ファイルが上書きされてしまいます。比較したい場合は、先に処理した方のファイル名を変えておいてください。（とくに "Read Me" ファイルは同名のものが多いので十分注意してください） ■変換辞書の作り方 ConvChar で文字列の置換に使う変換辞書は、通常のテキストファイルですから、簡単に作成、登録ができます。書式は置換前文字列＜タブ＞置換後文字列＜改行(CR)＞です。（ "＜" と "＞" は不要です）置換前文字列＜タブ＞＜改行(CR)＞とすれば "置換前文字列" は削除されます。 ▲改行（CR）は "¥r"、LFは"¥n"、タブは "¥t" 、半角スペースは "¥s" と半角英文字で記述します。 ▲"¥r"、 "¥t" などを文字そのものとして記述する場合は、それぞれ "¥¥r"、 "¥¥t" と記述します。 ▲改行、タブを含む辞書を同時に複数ロードして「マージする」で置換すると予想外の結果になることがあります。内容が矛盾しないように工夫して１つの辞書にまとめたうえで処理するか、「順次処理する」を選んでください。 ▲変換辞書は作製、追加したあと「行のソート」「重複行をまとめる」処理をしてください。 ▲英単語を置換元にするときは、置換時に大文字、小文字を同一視するかどうかを、最初に決めてから作成してください。 ▲２つの矛盾する内容の辞書をロードした場合、「辞書の扱い」で「マージする」を選択していると辞書ロード・メニュー上方で指定されているのが優先されます。 ▲１つの辞書内で矛盾する内容があった場合は、行順で後から出現した方に変換されます。 ▲解りにくい場合は同梱の「変換辞書サンプル」を参考にしてください。 ========================================================================== ■（例）通信ログなどから、決まり物の不要行を削除する辞書を作成する（BBSのメニューや毎回表示されるお知らせ、バナーを削除して快適にログ・ブラウズ） 1. 削除したい不要行をできるだけ多く含む通信ログなどを用意。 2. "¥r＜タブ＞¥¥r¥t¥r＜改行(CR)＞" という一行辞書で、用意したログを文字列置換する。 3. できたファイルから不要行として削除したい行以外を、手動で選択し削除する。これで辞書は完成。 4. 3のファイルを辞書に指定し「文字列の置換」後に「空白行を除去」を行う。 ■（例）Mac文書をDOS用に変換する一行置換辞書 "¥r＜タブ＞¥r¥n＜改行(CR)＞" ■（例）DOS文書をMac用に変換する一行置換辞書 "¥r¥n＜タブ＞¥r＜改行(CR)＞" ========================================================================== ■バージョン・ヒストリー・Ver. 0.3 (94年7月) 初公開バージョン。・Ver. 0.4 (94年8月) 1: ファイル出力先を選択できるようにした。 2: ソートを高速化。 3: 辞書ロードなどのバグを修正。・Ver. 0.5 (96年3月作成、7月公開) 1: FATバイナリー化した。 2: 細かなバグを修正。・Ver. 0.6 (96年4月) 未公開。・Ver. 0.7 (97年3月) 1: オプションでナチュラルオーダーソートを追加。 2: 「文字列の置換」で、内部的に英語、日本語の処理を区別して作業するように改善、特定の条件下で発生していた文字化けを解消。 3: その他、インターフェースなどの細部を改善。・Ver. 0.8 (97年5月) 1: 辞書ファイルを参照して行う文字列の一括置換で、「改行(CR)」と「LF」、「タブ」を扱えるようにした 2: スペース→タブ整形機能を見直し内部処理方法を改善。 3: タブ→スペース、スペース→タブ「置換」の名称を機能に即した「整形」へと名称変更。 4: 改行だけの行を含むテキストに「重複行をまとめる」処理をした場合に異常終了する問題を修正。・Ver. 0.8.1 (97年6月) 1: 0.8で「置換時に大文字、小文字を同一視」にチェックを入れて、日本語（2byte) 文字列を対象に「辞書を使った文字列の一括置換」を行うと、正しく置換ができなかった不具合を修正。 2: 一括置換辞書で、半角スペースを "¥s" で記述できるようにした。 ■開発環境及び動作確認環境 Mac OS 8.1、CodeWarrior Pro2、ResEdit 2.1.3 Power Macintosh 6100/60AV、8600/250、PowerBook 2400。 ■配布条件本プログラムはフリーウェアです。配布の際は "ConvChar0.8.2 Folder" の内容を変更せず、フォルダごとお願いします。転載していただく場合は下記にEメールでご連絡ください。また、便利な使い方や、自作の辞書で重宝なものができればご連絡いただくとともに、公開していただければ幸いです。なお、本プログラムを使用することによって発生した問題に対する責任は、一切取れません。各々の責任において使用して下さい。本プログラムの著作権は作者・金親はるかにあり、作者の許可なく改変して配布したり、販売または営利目的で使用すること、商品に添付して配布することを禁止します。 ■連絡先 e-Mail: VX1H-KNOY@asahi-net.or.jp Asahi-net mail: VX1H-KNOY NIFTY-Serve: GEC02334 金親寿男 URL: http://www.asahi-net.or.jp/~VX1H-KNOY/fw/fw.html ========================================================================== ■ナチュラルオーダー（Natural Order）ソートの簡単な説明 ----（例１）---- 5.到着 10.夕食 1.起床 4.出発 3.出発準備 12.就眠 7.昼食 2.朝食 9.帰還 11.宴会 8.帰路 6.作業 --------------- （例１）のようなリストを普通にソートすると ----（例２）---- 1.起床 10.夕食 11.宴会 12.就眠 2.朝食 3.出発準備 4.出発 5.到着 6.作業 7.昼食 8.帰路 9.帰還 --------------- 結果は（例２）にのように困ったことになります。これを避けるために "1" を "01" とするのが一般的ですが、行数が３桁になるとまずお手上げです。ナチュラルオーダーのソートなら、問題はありません。（例３）になります。 ----（例３）---- 1.起床 2.朝食 3.出発準備 4.出発 5.到着 6.作業 7.昼食 8.帰路 9.帰還 10.夕食 11.宴会 12.就眠 --------------- さらに英語の大文字、小文字も通常ソートなら、A〜Zの次にa〜zの順番になりますがナチュラルオーダーソートだと、AaBbCcDd〜Zz の順番になります。 ▲ConvCharでは全角 (2byte) 文字のナチュラルオーダーソートはサポートしていません。 --------------- ▲ナチュラルオーダーソートは、Stuart Cheshire氏<cheshire@CS.Stanford.EDU> のフリーウエア機能拡張 "Natural Order" の機能及びソースを参考にしました。 ========================================================================== end of doc